mysql数据删除多余的重复数据

来源:07素材网 02月19日 20:32
最近几年来,重复数据删除成为存储行业最炙手可热的技术,大多数中小型数据中心都没有配备足够的IT人员,更别说备份专家了,IT经理很难弄清楚如何在自己的数据中心融入重复数据删除技术,如果需要考虑部署重复数据删除技术,下面七个问题是IT经理必须全部回答的。

1、重复数据删除现在是主流技术吗?

是的,重复数据删除设备现在已经从实验室走向产品化,并逐渐成为主流,分析师告诉我们,至少有30%的IT部门在部分数据上使用了重复数据删除技术,厂商也推出了换代产品,专门为简化和无破坏性部署做了优化,但这并不意味着每个解决方案都是一样的,大多数重复数据删除厂商都经过了一个学习曲线,无论是在经验,参考文档还是在技术支持方面都已经有了很大的积累。

2、重复数据删除技术究竟能干什么?

一般来说,重复数据删除是在子文件级发现冗余数据的一种方法,它用一个指针代替重复的数据,这项技术可以有效减少磁盘存储空间需求,并降低数据传输的网络带宽需求。实现重复数据删除的方法不止一种,基于块级的重复数据删除方法是最常见的,但有些产品是在字节级发现文件集之间的差别,不同的技术实现手段其性能表现,需要的工作空间,对不同软件支持的难易程度,以及设置复制的难度也有所不同,具体采用哪种技术不重要,关键是看结果,只要能完美解决你现在面临的问题就ok。

3、重复数据删除技术最擅长解决哪类问题?

首先想到的应该是备份,因为备份会产生大量的重复数据,大多数常见的办公数据,如电子邮件,数据库和平面文件备份都可以利用重复数据删除技术节省大量的备份空间。

Quantum最近对其Dxi系列设备用户做了一项关于重复数据删除技术加入备份策略后的影响的调查,和传统存储系统相比,用户普遍反应在备份速度方面提高了125%,备份失败的次数降低了87%,在恢复方面更是发生了翻天覆地的变化,以前需要数小时或数天的恢复时间,使用重复数据删除技术后,现在只需要几分钟就搞定了,此外,成本也下降了,并且下降幅度很大,用户反应全部可移动媒体的成本几乎下降了一半,从异地磁带存储检索的成本也减少了97%,管理备份需要的时间减少了63%。使用远程复制技术进行灾难恢复保护的用户表示可以增加更多的恢复点,并实现自动化,可以消除分支机构的磁带机了。

4、它和我在使用的备份软件有关系吗?

大多数重复数据删除厂商都对不同的备份软件做了兼容性测试,有些厂商甚至专门针对多个备份软件做了数据存储优化,在评估重复数据删除厂商时,可以询问对方是否有专门备份软件做过优化,如果有,具体是哪些备份软件,你当前正在使用的备份软件是否也在列。

请记住,一定要检查对特定备份软件接口的支持,例如,赛门特克专门开发了一个OpenStorage接口连接备份设备,提供了额外一层业务优势,它提供更好的了性能,更好的复制管理。此外,还应该询问重复数据删除设备厂商与备份软件厂商的战略关系,需要深入了解他们的合作关系,以及他们未来关于互操作性和集成的规划。

5、实现重复数据删除最简单的方法是什么?

大多数IT部门面临的选择是直接上重复数据删除设备,还是在现有备份软件中插入重复数据删除功能,究竟哪一种办法是最容易部署的没有一个统一的答案,但根据以往的经验,我们可以提供一些最基本的指导,目前最常见的是直接上重复数据删除专用设备,所有备份数据都要先发送到该设备,在保存到最终备份目标设备上时执行重复数据删除,这种方法对现有备份方法不会执行大的变动,因为重复数据删除操作是在专用设备上执行的,它不会增加备份客户端或媒体服务器的负荷,部署就象复制一样简单,作为最常用的方法,它也是最成熟的,这意味着它的部署速度将是最快的,需要的技术支持服务也会很少。

使用软件方法时,备份软件需要插入重复数据删除任务,要么在备份客户端上执行,要么在媒体服务器上执行,在发送到目标备份设备之前删除重复数据,在网络上传输的数据就会少一些,其思想和传输前执行压缩是一样的,但重复数据删除过程往往会包含数据压缩,由于重复数据删除是一个开销相对较高的操作,备份操作可能会随之变慢,因此通常需要增加新的服务器或专用存储,这会增加成本和集成的复杂度。

根据所处的特殊环境不同,每个方法都有其优缺点,为了找到一个最适合自己环境的方法,首先应该从系统现在的瓶颈出发进行衡量,如你现在的媒体服务器利用率如何,以及你需要一个什么样水平的集成环境等等。

6、我应该彻底淘汰磁带存储吗?

虽然大多数使用了重复数据删除技术的用户都减少了可移动媒体的使用,但只有很少一部分用户完全消除它们,这是有原因的,通常,用户对备份有三个层次的需要:每日备份和恢复,近期灾难恢复保护和长期数据保留,研究适用于每一层的技术,并和那些专注于技术的公司交流将会受益匪浅。

每日备份和恢复:许多用户发现磁盘读写配置文件给他们的日常备份和恢复带来了许多好处,而重复数据删除技术则让数据能在磁盘上存储更长时间,越来越多的恢复方法也利用了这个配置。

近期灾难恢复:重复数据删除让用户使用远程复制技术取代了可移动媒体,他们可以创建更多的恢复点,降低成本,将以前大部分手工操作全部实现自动化。

长时间保留:可移动媒体继续提供强大的经济和安全价值,磁带消耗的电力,需要的制冷量和占用的空间更少,因此它成为长时间保留数据的不二之选,磁带新技术,如加密和介质完整性分析,使得它更加安全和可靠。

7、我可以从哪里得到客观的建议?

针对你的特殊环境,哪种方法最适合你?你可以从多种渠道获得客观的建议,有些独立分析师愿意直接与最终用户交流,他们能根据以往的经验提供非常有用和客观的信息,但如果你未成为大名鼎鼎的分析师的客户,还有其它办法。

一个最好的办法就是找经验丰富的经销商合作,好的经销商都有完整的参考资料可以帮助IT部门部署,他们能弄清楚你的环境最适合用哪种解决方案,并且他们会很乐意帮助你实施成功,当然,你也可以直接找厂商谈,如果他们能提供更多的技术,他们的观点和看法肯定比那些只能提供单一产品和技术的厂商更有意义,如果你已经有相中的备份软件厂商,不妨先看看他们有没有拿得出手的重复数据删除解决方案。
原文出处:http://www.unixcom.cn/thread-5542-1-3.html
版权声明:本文来源地址若非本站均为转载,若侵害到您的权利,请及时联系我们,我们会在第一时间进行处理。

头条

在使用SQLite3时遇到的几个坑

在使用SQLite3时遇到的几个坑

《本打算在SQLite3数据库里执行一个查询语句,使用的是php语言,起初遇到的是权限问题: permission denied,因为SQLite3数据库文件和PHP执行者属于两个不同的用户,首先需要对这个文件执行mode 777的权限开放,然后,又遇到了下面这样的PHP错误